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In this paper, we look at the progress made since Tifinagh characters were 
encoded in ISO/IEC 10646 and Unicode in 2005. Eight years ago, it was 
impossible to send documents written in Tifinagh without reference to a private 
encoded font. Today, you can create HTML pages, XML documents, email in 
Tifinagh. Now, There is a standard keyboard approved by the Moroccan 
standard body to enter Tifinagh text, a standard for sorting Tifinagh strings, 
and Microsoft provides by default in its newest versions a font that supports the 
Tifinagh. users can now view HTML pages without having to explicitly install a 
Tifinagh font on their system. Software libraries like ICU also support Tifinagh 
and it is possible in theory to have internet domain names in Tifinagh. 


Dans cette contribution, nous nous pencherons sur le chemin parcouru depuis 
le codcige des caracteres tifinaghes dans l ’ISO 10646 et Unicode en 2005. II y a 
huit ans, il etait impossible d ’ envoy er des documents en tifinaghes sans se 
referer a un codage de police prive. Aujourd’hui, on pent creer des pages 
HTML, des documents XML en tifinaghes, envoyer des courriels. II existe un 
clavier normalise pour saisir des textes tifinaghes, une norme de tri, Microsoft 
fournit une police qui prend en charge les tifinaghes. L’utilisateur pent 
desormais voir des pages HTML sans qu’il n’ait a explicitement installer de 
polices tifinaghes sur son systeme. Des bibliotheques logicielles comme ICU 
prennent egalement en charge les tifinaghes et il est possible, en theorie, 
d’ avoir des noms de domciine Internet en tifinaghes. 


Nous tenons a vivement remercier 1' IRC AM et plus particulierement le directeur du 
CEISIC, Youssef Alt Ouguengay, pour leur accueil chaleureux et I' organisation du 
colloque international a Rabat au cours duquel une premiere version de cet article a ete 
presentee. Nous voulons egalement ici rendre hommage au predecesseur de M. Ait 
Ouguengay, le professeur Lahbib Zenkouar, sans lequel la normalisation informatique du 
tifmaghe n’aurait ete ni aussi rapide ni aussi complete. 
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Introduction 

Le 31 mars 2005, Unicode 4.1 etait publie. II comprenait tous les tifinaghes 
normalises de 1’IRCAM ainsi que les principaux caracteres touaregs et kabyles. 

Avant cette date, il n’existait aucune fa 5 on de coder de maniere normalisee des 
textes tifinaghes. Chaque producteur utilisait un codage, le plus souvent de son cru, 
lie a une police particuliere. II etait done virtuellement impossible d’ec hanger des 
documents produits par des personnes qui utilisaient des polices tifinaghes 
differentes. C’etait vrai pour les courriels, les documents Word, les pages HTML 
en general et, bien sur, celles d’une encyclopedic en ligne naissante comme 
Wikipedia. 

Depuis huit ans bien des choses ont change : les tifinaghes normalises sont 
desormais de plus en plus presents sur Internet et dans d’autres produits et normes 
informatiques. Nous allons brievement passer en revue ci-dessous ces heureuses 
ameliorations. 

Les caracteres Unicode 

Le lecteur de cette contribution connait certainement les premiers caracteres 
tifinaghes qui ont ete codes dans Unicode 4.1 en mars 2005, car ils ont fait l’objet 
de plusieurs communications de 1’IRCAM et de ses chercheurs 2 . II ignore peut-etre 
certaines precisions apportees depuis 2005 qui se retrouvent dans les dernieres 
versions d’ Unicode. 

Les diacritiques 

Plusieurs variantes tifinaghes modernes utilisent des diacritiques pour completer 
les lettres du bloc tifinaghe. C’est ainsi que la notation Hawad utilise des 
diacritiques du bloc [U+0300-U+036F] commun a de nombreuses transcriptions 
latines. Ces signes s’utilisent pour representer des voyelles ou des consonnes 
etrangeres. Dans cette_ notation, <U+2D35, U+0307> X represente un « a » court, 
<U+2D49, U+0304> I un « i » long /i :/ et <U+2D31, U+0302> B permet d’ecrire 
un « p ». On indique certaines voyelles longues a l’aide de deux signes diacritiques, 
un « e » long /e:/ s’ecrit <U+2D49, U+0307, U+0304> 2. Ces signes sont affiches 
cote a cote, et non empiles, au-dessus de la lettre de base dans l’ordre d’apparition 
dans la chaine codee. 

Quatre caracteres ajoutes dans Unicode 6.0 et 6.1 

Deux caracteres tifinaghes ont ete ajoutes dans Unicode 6.0 (et bien sur dans la 
version correspondante de 1’ISO/CEI 10646) : 

- U+2D70 J SEP ARATEUR TIFINAGHE 
= tazaraste 

- U+2D7F a;,i LIANT DE CONSONNES TIFINAGHE 


2 Voir, par exemple, Lahbib ZENKOUAR (2004 : 173-175). 
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Le caractere U+2D70 J est ce signe targui dont Prasse dit 3 « Au Hoggar on nous a 
donne le separateur c, a l’interieur duquel s’ecrivait la derniere lettre de chaque 
mot phonetique. » 

Les deux figures ci-dessous illustrent 1’ utilisation de ce separateur. On remarquera 
que le signe est reflechi quand il s’ecrit dans un contexte de droite a gauche. 


,\\\\ ; o ! I a q £> I 1 ® 3 

£+ 0 •. -u! e 1 1 + * o '■ ■ «(?). ' XV^C^Y +V* 

„ . + o\ « 0 0 3 ZM + + o', . IV -t-i 

eoflAtf/I + o! ■*. ® 

-+■# ai \+ ! A 


Figure 1 : Exemple d'utilisation du separateur de mot, Slid de I'Algerie 

T@ ill* :-o|7) TI0 '//© E 0 T1 © 

oco0)+c^2)L#^©n::ii0 t+| i0 :I| /V 

q0 1100:50 STM. c:-:oq00T ^ 


Figure 2 : Utilisation au Niger dans un contexte de gauche a droite 

Le liant de consonnes U+2D7F « est un caractere de commande qui permet de 
forcer la formation d’une biconsonne. Nous etudierons son utilisation dans la 
section 2.3. Ligatures. 

Unicode 6. 1 a par la suite ajoute deux caracteres : 

- U+2D66 < LETTRE TIFINAGHE YE 

- U+2D67 - LETTRE TIFINAGHE YO 

YE et YO sont simplement deux voyelles preconisees par l’APT (Association pour 
la promotion des tifinaghs) au Niger pour transcrire les voyelles « e » et « o ». 

Ligatures 

Des le codage des tifinaghes dans Unicode 4.1, il etait possible de preciser que l’on 
prefererait obtenir une biconsonne (ou une triconsonne) en inserant un U+200D Bsi 
liant sans chasse entre les consonnes qui constituent la ligature souhaitee. On peut 


3 Karl-G. PRASSE (1972 : 152). 


13 


Patrick Andries 


egalement utiliser U+200C antiliant sans chasse entre deux consonnes pour 
decourager la formation d’une ligature a partir de ces deux lettres. 

C’est ainsi que l’on peut demander la formation de la biconsonne « rt » en ecrivant 
<U+2D54, U+U200D, U+2D5C> (o Ah ). Les polices pourvues d’une telle ligature 
devraient en presence de ces caracteres afficher le glyphe de celle-ci, par exemple 
©, E. O, ou ■+□ selon la police. II existe egalement quelques cas de triconsonnes : 
parmi celles-ci notons le groupe consonantique « nft » i x t dont la ligature est 
parfois H et « nkn » i ;• i represente dans certaines regions par 4 . Pour bien fixer 
les idees, on demandera la formation optionnelle de la ligature « nkn » a l’aide de 
la suite suivante de caracteres : <U+2D4F, U+200D, U+2D3E, U+200D, 
U+2D4F>. 

Certaines polices pourront etre depourvues de ligatures, d’autres n’en inclure que 
pour certaines variantes geographiques. Si une police venait a ne pas avoir de 
ligature correspondant a la suite de caracteres liee par un liant sans chasse, la police 
devrait simplement afficher les deux consonnes de base, a savoir ot dans notre 
exemple ci-dessus. 

Toutefois, aux yeux d’aucuns, il est apparu que le liant sans chasse qui n’indique 
que la formation facultative d’une biconsonne ne suffisait pas. II fallait pouvoir 
preciser qu’une biconsonne devait imperativement etre formee car la presence de 
cette ligature, dans une graphie non voyellee, indique l’absence d’une voyelle 
implicite entre les consonnes qui forment la ligature. C’est a cet effet qu’a ete 
introduit dans Unicode 6.0 U+2D7F ®y liant de consonnes tifmaghe. Ce caractere 
de commande impose la formation de la ligature. A ce titre, il joue un role similaire 
au U+0652 6 soukoun, le signe de quiescence arabe. Fe tableau ci-dessous illustre 
l’utilite d’une telle convention, les exemples sont tires du dictionnaire de Foucauld 
(Ch. de Foucauld, 1951). 


Fettres 
de base 

Graphie 

touaregue 

Translitteration 

Glose en franyais 

i :• o 

4o 

ankar 

se lever (inhabituel) 

i :• o 

nak:ar 

se lever (habituel) 

t : ot 

t : © 

teyert 

marmite en terre 

t : ot 

teyarit 

cri strident, tres peryant 

Ot i 

(=>■ 4 

istay 

chasser, pousser devant soi 

©t : 

asatay 

chasse, poursuite 

t HOt 

t ][© 

tafert 

mot, proposition, vers 

t Hot 

tefarit 

petite aiguille rocheuse 

1 V o 

Vo 

andar 

exceder les forces 

1 V o 

anadar 

fait d’etre en chaleur, en rut 


Dans les exemples ci-dessus, comme les biconsonnes sont considerees comme 
obligatoires, on n’utilisera pas de U+200D licint sans chasse, mais bien un 


4 On aurait aussi pu mettre © a la place de • . 
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U+2D7F liant de consonnes tifincigh. Le verbe chasser ©; se codera done 
<U+2D59, U+2D7F, U+2D5C, U+2D57>. 

Unicode prescrit que, si une biconsonne obligatoire ne peut etre affichee a l’aide 
d'une ligature correcte, le systeme de rendu devra faire apparaitre le liant de 
consonnes tifincighe (LCT) de maniere visible afin de bien indiquer F absence de 
voyelle entre les deux consonnes. Cela pourra prendre la forme d’un losange ♦, 
d’un ®y ou de tout autre glyphe. Unicode ne prescrit pas ce glyphe de repli. La 
forme de repli de <S, LCT, T> sera done <gS, i»q gT> oil gS est un glyphe de S, gT 
un glyphe de T et ®y est un glyphe qui indique la presence du liant de consonnes 
tifincighe. 

Rappelons que, si un systeme de rendu ne peut afficher une biconsonne 
optionnelle, e’est-a-dire dont les consonnes de base sont separees par un U+200D 
liant sans chasse (LSC), la forme de repli consiste simplement dans l’affichage des 
consonnes constitutives de cette ligature. La forme de repli de <S, LSC, T> est 
done <gS, gT>. 

Indicatif de langue [zgh] de l’ISO 639 

En novembre 2012, le comite de 1’ISO 639-2 a approuve l’ajout d’un indicatif 
[zgh I dans la liste officielle des noms de langues 5 qu'elle tient a iour. II designe 
l’« amazighc standard marocain » soit la norme convergente preconisee par 
1TRCAM qui integre les trois parlers amazighes du Maroc. 

Avant cette addition, il n’existait aucun moven de preciser au'un document 
numerique (ecrit ou parlc) etait en « amazighc standard marocain ». II fallait soit 
utiliser un indicatif comme Iberl qui represente toutes les langues de la famille 
berbere (v compris notamment le kabyle et le touareg) soit choisir de designer le 
texte comme une des variantes « dialectales » de l’amazighe marocain. 

On peut desormais indiquer qu'un document est en amazighe standard marocain 
avec l’attribut lang egale a « zgh ». Dans une page HTML (voir F extrait ci- 
dessous) dont la langue principale est F amazighe standard marocain, on l’indiquera 
en ajoutant un attribut lang="zgh" sur la balise correspondant au corps de la 
page (<body>) : 

<html> 

<body lang="zgh"> 

<hl> 0 XHAol 0 C**o</hl> 

<p>© UoUoH XOS £A0, 00IY ?o+ +YoU0o +C©0 
0lo+ OCo+OI: tiOt ©X AA SAAo oO tEZZIO, tm 0 Y o 0 
old I + 0 AA 0 O+ !</p> 

<p> 0 ^o oKXM +. ©0IY ^0 ©QQo I ... 


5 http://www.loc.gov/standards/iso639-2/php/code list.php 
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Claviers 

Clavier national normalise 

Depuis la normalisation des tifinaghes dans 1’ISO 10646 et Unicode, un clavier 
normalise marocain pour la saisie de ces caracteres a ete homologue par le 
SNIMA 6 . Ce clavier respecte la norme internationale en la matiere, 
1’ISO/CEI 9995. II a ete repris par plusieurs fabricants de Linux et inclus par 
Microsoft dans Windows 8. Normalise il y a plusieurs annees, ce clavier ne 
comprend pas les caracteres tifinaghes introduits par Unicode 6.0 et 6.1. 

Clavier tifinagh sur Windows 8 

Microsoft a adopte le clavier SNIMA dans Window 8 : 

% Clavier visuel 



Pour le selectionner, l’utilisateur doit ajouter un profil linguistique a partir du 
Panneau de configuration de Windows. Le profil linguistique regroupe une langue 
et une methode d’ entree correspondante. La langue correspond a un indicatif 
ISO 639. Dans Windows 8, le seul indicatif « berbere » disponible est [tzm], a 
savoir le parler amazighe de 1’ Atlas central. A partir de Windows 8.1, une nouvelle 
langue et son indicatif sont disponibles : l’amazighe standard marocain [zgh]. 


6 http://lrapax.qc.ca/pdf7NM%20 17. 6.000. pdf 
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♦ A ^ Options linguistiques - n SH 

(*") w 1* ^ « Langue ► Options linguistiques 

v C Rechercher p 

Standard Moroccan Tamazight 

Langue d'affichage de Windows 

Pas de module linguistique disponible. 

FRA Fran^ais (France) 

FR Clavier Fran^ais 



XM Standard Moroccan Tamazight 

Clavier Tifinagh (base) 


Appuyez sur la touche Windows + Espace 



, „ n Q . FRA 03:35 

* rW O il>) 

1 lu 1 ^ CAFR 21/07/2013 


L’illustration ci-dessus represente le dialogue de preference linguistique dans 
Windows 8.1, la prochaine version de Windows. Alt moment d’ecrire ces lignes, il 
n’etait pas encore totalement traduit en franqais. 

Une fois le clavier tifinaghe et la langue amazighe choisis, les lettres 
XV apparaissent en bas a droite de l’ecran pour indiquer que le clavier actif est 
amazighe. Sur l’illustration ci-dessus, le clavier actif est canadien-franqais 
(FRA/CAFR). 

Norme de tri 

Un ordre precis de tri des caracteres tifinaghes a egalement ete normalise par le 
SNIMA, il s’agit d’un « delta » de la norme internationale en la matiere, 
1’ISO/CEI 14651. Le meme ordre est egalement mis en oeuvre par les tris de 
caracteres Unicode (voir ci-dessus 8. Les bibliotheques logicielles ). 

Les documents XML, HTML 

Les fichiers XML peuvent en general contenir sans encombre du contenu tifinaghe. 
Ces documents - comme 1’ extrait ci-dessous - sont conformes. 

<?xml version="l . 0" encoding="UTF-8"?> 

<texte xml : lang="ber " lang="ber"> 

<hl>„ x M A ; I oEXXo</hl> 

<p>© UoUoH XOi i A © , © © I Y * „ + + V o U © o tt 00 

©i ot a.toi :?to? ©XAAtAAo : otcee: o, 

!H«, V,0,l Ci I ?ot toAAoOt ! </p> 

</texte> 

En 2008, lors d’une precedente contribution (Andries, 2008) oil nous avons 
aborde ce sujet, il existait une restriction dans les caracteres admis dans les noms 
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d’ element et d’attribut ainsi que dans certaines 7 valeurs d’attribut dans les 
documents XML 1.0. En effet, a l’epoque, XML 1.0 ne permettait pour ces noms 
que des caracteres appartenant au repertoire d’ Unicode 2.0. Cela signifiait que ces 
noms ne pouvaient contenir des caracteres tifinaghes, ou d’autres provenant 
d’ecritures comme l’ethiopien egalement introduits apres Unicode 2.0, pas plus que 
des caracteres importants recemment ajoutes a des ecritures qui existaient deja dans 
Unicode 2.0 comme le latin, l’arabe, le cyrillique ou le chinois. 

II n’etait done pas permis d’ecrire en XHTML : 

| <a name="t ; ©" id="+ ; ©">attribut touareg</a> 

Pas plus que ceci n’etait permis en XML 1.0 : 

| <+ : ot >...</ + : ot > 

Au vu de cette incongruite, le W3C charge de la normalisation de XML a decide de 
publier a la fin 2008 (le 26 novembre tres precisement) la cinquieme edition de 
XML 1.0 8 . Outre la mise a jour de quelques references bibliographiques et la 
correction de quelques errata, le grand changement introduit par cette edition est de 
permettre la quasi-totalite des caracteres Unicode et notamment les tifinaghes dans 
les noms d’ element et d’attribut ainsi que les valeurs d’attribut. 

En theorie, la pratique est identique a la theorie, mais en pratique cela peut bien sur 
etre different. Pour qu'un nom d’ element en tifinaghes soit accepte par un logiciel 
de traitement de documents XML, il faut tout de meme que les analyseurs 
(parseurs) XML soient modifies pour mettre en oeuvre la nouvelle regie de 
formation des noms. II faudra done encore attendre quelques annees avant que les 
analyseurs en place soient mis a jour pour que l’echange de documents 
XML/XHTML avec des tifinaghes dans les noms d’ elements et d’attributs puisse 
se faire sans encombre. Par contre, si les documents XML ne sont utilises qu’en 
interne oil sont controles les analyseurs XML, il se peut que, en mettant a jour 
ceux-ci pour choisir une version qui prend en charge la cinquieme edition de XML 
1.0, vous puissiez des aujourd’hui utiliser des documents XML dont les noms 
d’ element, d’attribut et les valeurs d’attributs contiennent des tifinaghes. 

Les polices 

Ebrima sur Windows 

Depuis Windows 7, Microsoft inclut en serie dans son systeme d’ exploitation une 
police « panafricaine », la police Ebrima. Elle est fournie en deux graisses : 
normale et grasse. Ebrima a ete con 5 ue pour prendre en charge un grand nornbre de 
langues africaines. Elle 


7 Les attributs CDATA peuvent contenir n’importe quoi, la restriction etait sur les attributs 
declares ID, IDREF, NMTOKEN, etc. 

8 <http://www.w3.org/TR/2008/REC-xml-20081 126/> 
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contient des glyphes pour le n’ko, les tifinaghes, le vai et l’osmanya. Les glyphes 
latins de la police sont accompagnes des diacritiques et autres signes utilises pour 
representer les langues africaines. 

Les ceils tifinaghes d’Ebrima sont directement inspires de ceux utilises dans les 
tableaux Unicode (c’est-a-dire de Hapax Berbere). 

La police Ebrima ne comprend pas les deux voyelles nigeriennes (ye et yo) 
introduites par Unicode 6.1, elle comprend cependant depuis Windows 8 plusieurs 
innovations par rapport aux versions precedentes : 

1 . On peut ajouter des diacritiques a toute lettre tifinaghe 9 : 



1/ Q Essais die 

c 

icritiques x \ 

_D file:///C:/pi 


© 0 T 

o o 


2. De nombreuses biconsonnes ont ete ajoutees a la police, elles sont 
formees a l’aide du U+2D7F SJ LIANT DE CONSONNES 
TIFINAGHE, notamment 

I + <U+2D7F> + / "> | 

3. Quand une biconsonne ne peut etre formee parce qu’elle n’est pas 
prise en charge par la police, Ebrima affiche une serie de points 
souscrits sous la paire de consonnes : 

AV 


Les polices incorporees dans les pages HTML 

Avec une ecriture aussi recente - en termes de normalisation informatique - que le 
tifinaghe, il n’est pas rare qu’un utilisateur qui desire afficher une page Internet qui 
contient des caracteres tifinaghes n’ait pas de police tifinaghe a sa disposition. 

Malgre la diffusion recente d’Ebrima, le probleme demeure entier aujourd’hui, car 
il existe encore de nombreux utilisateurs qui n’utilisent pas Windows et a fortiori 
Windows 7. 

En outre, que faire quand on veut etre sur qu’une page s’ affiche dans un style 


9 Ceci fonctionne bien avec les trois grands navigateurs (Chrome, Firefox et Internet 
Explorer) et dans Windows 8. 1 avec MS Word 2013. 
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tifinaghe particulier ? On risque done dans ces cas-la d’etre confronts a des pages 
remplies de petits rectangles blancs comme dans 1’ illustration ci-dessous, chaque 
rectangle y represente un caractere (tifinaghe ici) qui ne peut etre represente par 
manque de police adequate. 

II existe plusieurs remedes possibles a ce desagrement. Une solution consiste a 
prevenir les lecteurs des pages en tifinaghe qu’ils doivent installer une ou plusieurs 
polices en fournissant un lien permettant de telecharger ces polices. II existe 
cependant une autre solution : les polices dynamiquement telechargeables. Cette 
solution consiste a envoyer les glyphes necessaires a l’affichage d’une page HTML 
avec la page en question. On parle alors de polices embarquees ou incorporees. 


Extrait du dictionnaire touareg-fran^ais de Charles de Foucauld (page 339) 

□ □ eferi □□□ sm. cp (pl iferan □ □□), da r aferi ( eferi )- dar feran || aiguille 

rocheuse (quelconque) || differe d'adaouda « aiguille rocheuse tres mince 
(ressemblant a un doigt) ». Tout adaouda est un eferi . mais non inversement. 

— teferit □ □ □ □ sf. (p (pi. tlferatin □ □□□□), da r taferlt (teferit) - da r tferatin || 
dim. du pr. 

□ □ tafirt □□□ sf. <p (pi. tifir □□□), da r tfir || mot (une syllable ou plusieurs 

syllabes reunies exprimant une idee) || p. ext. « quelques paroles (paroles en 
petit nombre) » || p. ext. « vers (assemblage de mots rythmes d'apres des regies 
determinees en poesie) » Le sing, tafirt signifie un vers, le pi. tifir signifie 2 ou 
plusieurs vers. 

□ □ aferra || v. □ □ C affi . 

Figure 3 : Police manquante dans une page HTML 

II y a pres de deux ans, en 2008, nous avions deja aborde les techniques alors 
disponibles (Andries, ibid.). Rappelons que les polices incorporables dans les pages 
HTML ne sont pas une idee neuve. Des 1998, CSS 2 permettait de preciser un lien 
vers une police que les fureteurs internet pouvaient telecharger. Microsoft et 
Netscape prirent en charge cette syntaxe et permettaient de telecharger des polices. 
Malheureusement, aucun des deux fabricants ne prenait en charge directement le 
format de police le plus populaire : TrueType. Microsoft choisit le format de police 
EOT (un format proprietaire) dans Internet Explorer 4.0 alors que Netscape 4.0 jeta 
son devolu sur un format rival TrueDoc qu’il abandonna deux versions plus tard, 
car Mozilla ne pouvait rendre public le code source de TrueDoc, propriete de 
Bitstream. 

Depuis 2008, cette question a connu un vif regain d’interet. A partir de 2010, on a 
assiste a un veritable engouement pour les polices internet. Subitement, coup sur 
coup, on a assiste a 1’ elaboration d’un format de police conque pour le 
telechargement sur Internet (WOFF), la prise en charge de ce standard naissant par 
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les quatre grands concepteurs de moteurs de composition HTML 10 et enfin la mise 
en place de nombreux sites de partage ou de vente de polices incorporables dans 
des pages HTML 11 . 

• WOFF 

WOFF est un format de police embarquee qui a ete propose au W3C par Microsoft, 
Mozilla et Opera. II a ete con 5 u pendant l’annee 2009. Le 27 juillet 2010, le W3C 
publiait un « projet de travail ». Le 13 decembre 2012, WOFF devenait une 
« recommandation » W3C, un standard Internet. 

Fondamentalement, WOFF est une enveloppe qui recouvre les polices de type sfnt 
(a savoir TrueType, OpenType ou Open Font Format) qui ont ete comprimees a 
l’aide d’un outil qui leur permet d’etre incorporees dans des pages HTML. Ce 
format utilise une compression zlib qui assure habituellement une reduction de plus 
de 40 % par rapport a la police TTF equivalente. 

WOFF est pris en charge par Firefox depuis sa version 3.6 et par Chrome de 
Google depuis la version 6.0. Microsoft, pour sa part, la prend en charge depuis la 
version 9 de son navigateur. Enfin Opera, le permet depuis sa version 11.10. 

WOFF en tant que tel ne contient aucun mecanisme de securite qui empecherait la 
copie de la police. Certains navigateurs, toutefois, ne telechargent que les polices 
qui sont hebergees dans le meme domaine que la page qui y fait reference. De 
meme, 1’ optimisation qui consiste a ne selectionner et envoy er sur le reseau que le 
sous-ensemble de glyphes correspondant aux caracteres utilises dans la page 
HTML demandee (ou un ensemble de pages) est laissee a des outils tiers qui ne 
font pas partie de la norme. 

• Antres formats 

Malgre le fait que les nouvelles versions des grands navigateurs prendront toutes en 
charge le format WOFF, il est important de consider er le pare actuel des 
navigateurs internet, trois autres types de polices telechargeables y sont utilises : 

TTF Fonctionne bien avec la majorite des fureteurs 

(mais pas IE, ni 1’ iPhone), volumineux car non 
comprime. 

EOT Uniquement sur IE, necessaire pour IE 5 a 8, 

comprime, permet de ne selectionner qu’un sous- 
ensemble de glyphes qu’on retrouve dans une 


10 Les quatre grands moteurs de composition sont Trident de Microsoft, Gecko de Mozilla, 
Webkit utilise notamment par Google et Safari et Presto d' Opera. Chacun de ces moteurs de 
rendu est utilise dans plusieurs applications : Presto se retrouve ainsi, non seulement dans le 
fureteur Opera, mais aussi dans des produits Nintendo, Nokia, Sony, Adobe et Macromedia. 

1 1 Parmi ces sites, on peut citer : <typekit.com>, <fontsquirrel.com>, <typotheque.com>, 
<openfontlibrary.org>, <fontshop.com> et <fontfont.com>. 
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page HTML donnee. 

SVG Format XML necessaire pour 1’ iPhone et 1’iPad 

avant la version 4.2, volumineux. 


• Hapax Berbere et Hapax Tifinar Carree 

Les polices Hapax Berbere allegee et Hapax Tifinar Carree sont disponibles sous 
quatre formats (TTF, EOT, SVG et WOFF) respectivement aux adresses suivantes 
<hapax.qc.ca/essai-polices-incor/hapaxber-sousensemble-webfont.zip> et 

<hapax.qc.ca/extrait-foucault/hapaxtifinarcarree.zip>. 

La police Hapax Berbere allegee ne comprend qu'un sous-ensemble restreint de la 
police Hapax Berbere alors que la police Hapax Tifinar Carree est complete (et 
done assez volumineuse). On peut les copier et les utiliser a loisir. Deux pages de 
demonstration permettent de voir ces polices Web en action : <hapax.qc.ca/essai- 
polices-incor/HapaxBerbereRegular-demo-hex.html> et <hapax.qc.ca/extrait- 
foucault/foucault-p339.html>. 

• @font-face et CSS 

Revenons a notre extrait du dictionnaire touareg de Charles de Foucauld. Comment 
s’ assurer que la page s’affiche correctement tant sur les anciennes versions de 
MSIE, les iPhone, les iPad que les nouvelles versions de Firefox ? 

La premiere etape est de creer un ensemble de polices TTF, SVG, EOT et WOFF. 
Un site comme Font Squirrel 12 permet de fournir sa police en entree et de creer des 
versions SVG, EOT, TTF et WOFF de celle-ci ainsi que de ne selectionner qu'un 
sous-ensemble des glyphes de la police d’origine afin de reduire encore la taille des 
fichiers produits. 

Dans notre cas, la police Hapax Tifinar Carree utilisee dans la page du dictionnaire 
Charles de de Foucauld a deja ete transformee en ces quatre formats. II suffit de 
telecharger P ensemble 13 , de les dezipper et de les placer dans un repertoire du 
serveur. Le code fourni ci-dessous assume que les polices sont presentes dans le 
meme repertoire que les feuilles de style CSS. 

II faut ensuite definir la police Hapax Tifinar Carree dans CSS a l’aide d’une 
declaration @font-face. C'est ce que fait le code ci-dessous. II definit cette 
meme police dans deux declarations que les principaux navigateurs comprendront. 
Si les polices ne sont pas stockees dans le meme repertoire que le code CSS, on 
n’oubliera pas de changer les url ( ) pour y indiquer l’URL qui correspond a leur 
position. 


12 Voir <fontsquirrel.com/fontface/generator>. Font Squirrel fournit egalement les ©font- 
face a incline dans vos feuilles de style. 

13 Disponible ici : <hapax.qc.ca/extrait-foucault/hapaxtifinarcarree.zip>. 
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0font-face { 

/* Declaration destinee a Internet Explorer 

*/ 


font-family: 'HapaxTif inarCarree ' ; 
src: url (' hapaxtif inarcarree . eot ' ) ; 


0font-face { 

/* Declaration destinee a tous les autres */ 


font-family: 'HapaxTif inarCarree ' ; 
src: url(//:) format ( 'pasde404 ') , 

url (' hapaxtif inarcarree .woff ' ) format ('woff'), 
url ( ' hapaxtif inarcarree. ttf ' ) 
format ( ' truetype ' ) , 

url ( ' hapaxtif inarcarree.svg#webfontrYQ4E2jU' ) 

format (' svg' ) ; 

font-weight: normal ; 
font-style: normal ; 


Extrait du dictionnaire touareg-fran^ais de Charles de Foucauld (page 339) 

□ □ eferi □□□ sm. cp (pl.iferan □ □□), dar aferi (eferi ). dar feran || aiguille 

rocheuse (quelconque) || differe d'adaouda « aiguille rocheuse tres mince 
(ressemblant a un doigt) ». Tout adaouda est un eferi . mais non inversement. 

— teferit □□□□ sf. (p (pi. tiferatin □□□□□). dar taferlt ( teferlt ). dar tferatin || 
dim. du pr. 

□ □ tafirt □□□ sf. (p (pi. tifir □□□), dar tfir || mot (une syllable ou plusieurs 

syllabes reunies exprimant une idee) || p. ext. « quelques paroles (paroles en 
petit nombre) » || p. ext. « vers (assemblage de mots rythmes d'apres des regies 
determinees en poesie) » Le sing, tafirt signifie un vers, le pi. tifir signifie 2 ou 
plusieurs vers. 

□ E aferra || v. □ □ □ afri . 

Nous reviendrons sur ces declarations par la suite. Pour T instant, il suffit de savoir 
que ces declarations permettent aux navigateurs de savoir ou trouver la definition 
d’une police nommee HapaxTifinarCarree. 

Pour employer la police dans des documents HTML, il nous reste a preciser en 
CSS quand l’utiliser. Le code ci-dessous precise, par exemple, que les paragraphes 
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(<p>) devront d’abord utiliser la police HapaxTifinarCarree, puis si des glyphes 
manquent d’employer la police Arial et enfin, par defaut, n’importe quelle police 
sans empattements. 

p {font-family: 'HapaxTifinarCarree', Arial, sans- 
serif ; } 

Dans le cas de 1’ extrait du dictionnaire touareg, nous desirons d’abord utiliser des 
polices a empattements hautement optimisees comme Times New Roman pour le 
texte latin avant d’utiliser les glyphes de la police Hapax Tifinar Carree dont les 
glyphes latins sont moins esthetiques. 

body { 

font-family : Times New Roman, HapaxTifinarCarree, 

serif ; 

width: 650px ; 
text-align: justify; 

margin-left: auto ; margin-right: auto ; 

} 

Ensuite dans le corps de la page HTML, il suffit d’ecrire par exemple 


<p>- <u>tef erit</u> + xot sf. cp (pi. 
<u>tiferatin</u> t xot I ), <u>dar taferit</u> 
(<u>teferit</u>) , <u>dar tferatin</u> | | dim. du 
pr . </p> 


pour que les caracteres latins s’ecrivent a l’aide de la police Times New Roman et 
les caracteres tifinaghes avec la police Hapax Tifinar Carree comme dans la figure 
ci-apres. 
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Extraits du dictionnaire de Foucauld - Mozilla Firefox 




FJsstir '.I'Je U 

| http://hapax.qc.ca/extrait-foucault/foucault-p33 ti - 1 if - Google 

Extraits du dictionnaire de Fo... 


iSiietrait du dictionnaire touaregfrancais de /3/ar/es de FFoucaufd 

/page 339 J 

][□ eferi ][D5 sm. cp (pl.iferan HCDI). da r aferi (eferi ), da r 
feran || aiguille rocheuse (quelconque) || differe 
d'ad aou da « aiguille rocheuse tres mince (ressemblant a 
un doigt) ». Tout ad aou da est un eferi. mais non 
inversement. 

— teferit +][□+ sf. cp (pi. tiferatin +][□+!), da r taferit 
( teferit) . da r tferatin 1 1 dim. du pr. 

][□ tafirt +][□*■ sf. cp (pi. tifir +][□), dar tfir || mot (une 
syllable ou plusieurs syllabes reunies exprimant une idee) 
|| p. ext. « quelques paroles (paroles en petit nombre) » || 
p. ext. « vers (assemblage de mots rythmes d'apres des 
regies determinees en poesie) » Le sing, tafirt signifie un 
vers, le pi. tifir signifie 2 ou plusieurs vers. 

][□ aferra || v. ][D5 afri . 


Figure 4 : Page avec des polices Internet incorporees 

• Retour sur les differents @font-face 

Chaque @ font-face permet de declarer plusieurs fichiers alternatifs pour un 
meme nom de police, en separant chacun des emplacements, les url ( ) , par une 
virgule : 

0font-face { 

font-family : 'maPolice'; 

src : url ( 'maPolice . wof f ' ) format ( 'woff ') , 

url ( 'maPolice . svg#abcd ' ) format ( ' svg' ) , 
url ( 'maPolice. ttf ' ) format ( 'truetype ' ) ; 

} 
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La propriete src est suivie de l’url d’un fichier de police puis d’un format 
optionnel. Declarer le format permet de preciser explicitement aux navigateurs le 
type de police associe a l’url qui precede et d’eviter ainsi au fureteur d’ avoir a 
telecharger le fichier en question pour en verifier le format. 

L’url de la police SVG se termine par un nom de fragment apres le croisillon 
(« # »). Ce nom precise ou. dans le fichier SVG, se trouve la declaration de police. 
A premiere vue, cela peut paraitre superflu, il faut toutefois se rappeler qu'un 
fichier SVG peut contenir bien d’autres choses qu'une police de caracteres ou 
meme en contenir plusieurs. 

L’ordre de declaration des formats est egalement important : d’abord WOFF, puis 
selon la taille des fichiers, la version SVG et enfin TrueType. II est important de 
considerer l’ordre de declaration, car certains navigateurs prennent en charge 
plusieurs de ces formats et utiliseront le premier qu’ils comprennent dans la liste 
fournie. Or, dans cette liste, WOFF est - comme nous l’avons vu - nettement plus 
leger que TTF. Le SVG etant un format XML, les fichiers peuvent vite devenir 
volumineux. Pour palier cet inconvenient, il en existe une version comprimee qui 
porte le suffixe . svgz. Elle est toutefois peu prise en charge par les fureteurs. En 
outre, si votre serveur gere la compression des requetes HTTP, cet artifice n’est 
guere utile. La version compressee d’une police SVG est, en regie generale, plus 
legere que sa version TrueType. 

Pourquoi, dans notre code ne trouve-t-on pas de declaration comme ci-dessous ? 


src : url ( 'maPolice . eot ' ) format (' eot ' ) ; 


La raison en est simple : Internet Explorer ignore la propriete format 14 et ne 
prend en charge qu’une valeur d’url ( ) . En outre, confronts a la ligne 


src : url ( 'maPolice .woff ' ) format ( 'woff ' ) ; 


Internet Explorer cherche a telecharger une police du nom suivant : 
« maPolice .woff ' ) format ( 'woff ». MSIE envoie une requete dans ce 
sens au serveur et attend que le serveur lui reponde. Il le fera a l’aide d’un 404 (pas 
trouve), car bien evidemment il n’ existe pas de telle police sur le serveur. Cet appel 
au serveur est inutile et inefficace. 

C’est pourquoi 13 , pour les versions 4 a 8 de MSIE, on ajoute une declaration 
supplementaire : 


14 Ceci est corrige a partir de la future version 9 d 'Internet Explorer. 

15 Pour plus de details sur les bogues d’IE en la matiere, voir <http://covertprestige.info/css/font- 
face/>. 
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@font-face { 

/* Declaration destinee a Internet Explorer 

*/ 


font-family: 'HapaxTif inarCarree ' ; 
src : url ( ' hapaxtif inarcarree . eot ' ) ; 

} 

et l’on ajoute cette premiere ligne dans la deuxieme declaration 16 : 

j src: url(//:) format ( 'pasde404 ') , 

afin que la requete inutile d’lE echoue avant 1’ envoi de celle-ci, car aucun 
protocole ni aucun serveur ne correspond a l’url fourni. 

Les bibliotheques logicielles 

Grace a la normalisation des tifinaghes il y a 8 ans et a leur inclusion dans 
Unicode, aujourd’hui les bibliotheques logicielles permettent de traiter les textes 
ecrits en tifinaghes. Si Java 6 ne connait pas les proprietes des caracteres 
tifinaghes, ce n’est pas le cas d’ICU 17 , une bibliotheque Unicode 18 qui sert de 
terrain d’essai a Java et dont les fonctionnalites sont habituellement integrees avec 
un certain retard dans Java. 

On trouvera ci-dessous un exemple de programme Java qui permet de decouper un 
texte Unicode en « mots ». On remarquera que la syntaxe du Breaklterator ICU 
utilisee ici est identique a celle de Java. II suffit souvent pour acceder aux 
fonctionnalites d’ICU de remplacer l’import de Java (ici java.text. Breaklterator) 
par son equivalent ICU (com.ibm.icu. text. Breaklterator) : 

import com. ibm. icu. text .Breaklterator ; 

// import java.text .Breaklterator; 


public class AnalyseMotsTif inaghes 

{ 

public static void main (String [ ] args) 

{ 


16 On preferera cette astuce a celle qui consiste a ajouter une propriete local ( ) qui plante 
le navigateur du systeme d’ exploitation Android utilise sur des telephones intelligents : 
<readableweb.com/best-practice-for-font-face-css-takes-a-turn>. 

17 On peut telecharger ICU pour Java ici : ici <download. icu-project.org/files/icu4j/> 

18 Pour une introduction a ICU, voir le chapitre 12 d 'Unicode 5.0 en pratique, Dunod 
(2008), Paris. 
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String texteAExaminer = ©x; XH : I ; ©xx“ , © 

,[,xt/o«[iAi ;©xx"o©oEoX?VoEo^i t ; 
int debut=0; 

Breaklterator frontiere = 

Breaklterator . getWordlnstance ( ) ; 

frontiere. setText (texteAExaminer) ; 

debut = frontiere . first () ; 

for ( int fin = frontiere . next () ; 
fin != Breaklterator .DONE; 
debut = fin, fin = f rontiere . next ( ) ) 

{ 


System. out .println (texteAExaminer . substring (debut, fin) 


Ce programme divise le texte en mots en se basant sur les proprietes 19 Unicode des 
caracteres (est-ce une lettre, un signe de ponctuation, un chiffre, un espace ?) et 
produit le resultat suivant : 

0 OKI XU X 

1 

: ©xx“ o © 

0 C o Xi V 

© 

HEI A 

1 

I ©XX" o © 
o [ o XS V 
o c o i i ; 

ICU comprend bien plus que cette fonctionnalite, il permet notamment de trier 
des textes tifinaghes et definit des donnees de localisation (nom de mois, format 
des dates, etc.) en tifinaghes. .NET de Microsoft offre des fonctionnalites 
similaires. 


19 Voir le chapitre 4 d ’Unicode 5.0 en pratique, Dunod (2008), Paris. 
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Le repertoire de donnees de localisation CLDR 

Depuis l’homologation de l’indicatif [zgh] par 1’ISO 639-2, il est desormais 
possible de l’utiliser dans des depots de donnees numeriques ou un « Repertoire de 
donnees de parametres regionaux classiques » comme CLDR. Le CLDR contient 
des informations specifiques aux parametres regionaux (les « locales » en jargon 
informatique) fournies pour faciliter 1’ adaptation des applications informatiques a 
des langues ou des cultures differentes. Le CLDR comprend done : 

■ des traductions pour les noms de langues ; 

■ des traductions pour les noms de territoires et de pays ; 

■ des traductions pour les noms de monnaies, y compris les modifications 
singulier/pluriel ; 

■ des traductions pour les jours de la semaine, les mois, dans des formes 
completes et abregees ; 

■ des traductions pour les fuseaux horaires et des exemples de villes (ou 
similaire) pour les fuseaux horaires ; 

■ des traductions pour les periodes du calendrier ; 

■ des motifs pour formater/reconnaitre des dates ou des heures, etc. 

Grace a CLDR (dont les donnees sont notamment integrees dans ICU) il devient 
facile pour un programmeur (meme s’il ne connait pas l’amazighe) de concevoir 
des programmes qui pourront afficher, par exemple, des dates en franqais et en 
amazighe standard du Maroc. Pour afficher la date en franqais, il precisera 
simplement la valeur ISO 639 « fr » comme « locale », pour 1’ afficher en amazighe 
standard il utilisera « zgh ». 

Des donnees initiales pour [zgh] ont ete versees dans le repertoire CLDR, elles 
devraient, toutefois, etre completees et revisees dans les mois a venir. 

Adresses internet, courriel et noms de domaine internationalises 
(NDI) 

Lors du colloque de 1’IRCAM en 2008 (Andries, op.cit.), nous avions deja aborde 
le sujet des adresses internet internationalisees du type <http://www.biscuits- 
sales.com/Noel.html>. Techniquement on nomme ce type d’adresse des 
identificateurs de ressource internationalisee (IRI). Ces adresses se divisent en trois 
parties principals, la premiere avant le « :// » indique le protocole a utiliser (ici 
http), ensuite vient le nom de domaine proprement dit puis, apres un « / », le 
chemin de la ressource sur le serveur identifie par le nom de domaine. 
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http:// 

www.biscuits-sales.com 

Noel.html 






protocole domaine chemin 


Tous les domaines de tete (le .ma, le fr ou . com final du nom de domaine) 
n’acceptent pas ces adresses internationalisees. Certains domaines de tete comme 
la Suisse (.c/7) acceptent des accents fran 5 ais (et plus generalement les lettres 
accentuees de ses langues nationales) alors que la France n’accepte pas de tels 
accents dans les domaines qui se terminent par fr . La politique d’ attribution de ces 
noms est decidee par F autorite d’enregistrement responsable d’un domaine de tete 
particulier. Au Canada, il s’agit d'une agence sans but lucratif (l’ACEI) regie par 
les lois canadiennes. Les domaines de tete generiques (.com, .org, .biz) sont 
administres aux Etats-Unis en vertu des lois americaines. 

Comme nous le mentionnions deja en 2008, les navigateurs modernes 
transformeront de maniere transparente les noms de domaine comme biscuits-sales 
en des noms de domaine compatibles avec 1’ infrastructure actuelle prevue pour des 
adresses ASCII. 


Sous-domaines 



ircam 

hapax .qc 

biscuits-sales 


Domaine de tete 


x 

( 

' 


.ma 


.ca 


.com 


Figure 5 - Parties d'un nom de domaine 


Ce qui a change depuis ce colloque, c’est l’approbation d’IDNA 2008 qui a mis a 
jour le repertoire des caracteres permis, passant d’Unicode 3.2 a Unicode 5.2. Par 
ce fait meme, tous les caracteres tifinaghes marocains peuvent, en theorie, etre 
utilises dans les adresses Internet. II est important d’ insister sur la dimension 
theorique de cette avancee, car F acceptation de ces caracteres dans les noms de 
domaine depend des autorites d’enregistrement de noms de domaine. Pour que des 
sous-domaines en tifinaghes soient acceptes dans des adresses du domaine de tete 
.ma, il faudra done que l’organisme responsable de F attribution des noms de 
domaine au Maroc le permette. 
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Conclusion 

Depuis 2005 et la normalisation du tifinagh dans Unicode et l’ISO/CEI 10646, 
beaucoup de choses ont change. II est de plus en plus facile d’utiliser des tifinaghes 
sur internet et dans les applications informatiques. 

II reste encore, bien sur, dans ce domaine quelques ameliorations possibles. On 
peut citer des pistes comme le fait de s’ assurer que des claviers et des polices 
tifinaghes soient disponibles sur les telephones intelligents et les tablettes 
informatiques, la diffusion et l’emploi de CSS 3 qui permettra une typographic fine 
des polices, embarquees ou non, la mise en place concrete d’IDNA 2008, la 
creation et la diffusion de ressources de localisation en tifinaghes et amazighe, la 
mise a jour du clavier tifinaghe pour inclure les nouveaux caracteres tifinaghes 
Unicode, etc. Dans ces domaines, les choses avancent et des solutions techniques 
existent deja ou se dessinent pour que l’utilisation des tifinaghes et de l’amazighe 
dans tous ces domaines se fasse desormais sans entrave. En huit ans, que de chemin 
parcouru ! 
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